无人机扫地机器人机器人咖啡机……人工智能已经开始融入深圳人的生活
目前人工智能是最热的产业赛道深圳也提出了一个新目标要打造“人工智能先锋城市”对此,深圳市龙岗区发布了《创建人工智能全域全时应用示范区的行动方案》积极推动AI应用
一起来聊聊
人工智能发展到了什么样的程度?
智能化还有哪些提升的空间?
米鹏民:人工智能现在已经火爆天了,特别是美国ChatGPT,它有一些在未来大家能感受到的个人应用上的一种场景,所以把大家这种想象力又给点燃了,而且这种期待也很迫切。丁院长你们现在来判断,我们普通人对这种期待的乐观程度,是不是过于乐观?
丁宁:我个人判断还是相对乐观了一点。因为它从语言的问题,然后再延伸到对制造业、对更多更复杂的场景的认知,这个过程还是比想象中要复杂。
米鹏民:在这种情况下,深圳龙岗区提出了一个提法,叫“人工智能全域全时应用场景”。咱们这个研究院也是在龙岗。丁宁:这次龙岗区发布的叫“全域全时应用场景”的示范,这对人工智能来说一个重大的举措。大家都知道智能这种能力,它是来源于数据,其实这个场景也就意味着数据。这个场景具体的是指什么?比如说现在大家在医院场景里面,有的时候会遇到像一些送药的、送物品的医疗物资运送的机器人,但是医院场景里面,它有它的特殊性,人流量很大,然后还要上下电梯。你怎么在合适的时候、合适的人群里面去避让,同时还要保证效率?能不能准确地送到位?那么新的技术在这种场景里面,经过一些试错,它的这种适用性和对这个场景的理解就逐步地深入,效率会提高。丁宁:全域实际上就是讲它的空间层面,它覆盖的地理概念,类型比较多,各种形态、各种极端环境可能也都有。它不同的这种时间的背景,将智能理解世界的边界拉得更广一点,那么让智能理解世界的程度就更深刻一点。米鹏民:我看到龙岗“人工智能场景”有一个亮相,在9月11日,这里面有一个叫警用巡逻机器人,其实我挺好奇的,这个机器人它能够真的像警察一样去巡逻执勤吗?丁宁:在巡查巡防方面,尤其是在一些比较复杂的场景里面,机器人实际上是可以起到一些辅助作用。其实它的智能能力,主要是提供一种对环境的观察,视觉能力对于人脸识别、对于一些在逃犯人的跟踪,包括一些行为方面,比如说聚集或者一些高声喧哗,或者一些肢体动作。丁宁:实际上要去场景里验证,暴露出它的不足,然后发现一些新的机会、新的需求。米鹏民:龙岗还创造了一个词,叫“陪跑”,搞了一个线上的虚拟平台——线上工研院。它有一个说法叫做政府来帮企业搭场景。那么这个场景,真的需要政府来搭,更有利吗?还是用市场的方式更有利?丁宁:我个人理解,是我们国家的全工业体系、全场景,都在自己的地盘上面,它比较丰富。政府如果能够提前做些举措,鼓励企业开放这种场景,并且从政府的角度提供一些支撑,这可能会提高效率。试错的环节避免不了会出一些这样那样的问题,考虑不周全的地方,那么政府的陪跑过程,我觉得还真是比较关键。丁宁:要有为这个事情来起到中间协调的(作用),大家都认可的这么一个(环节)。苗凡卒:基本上企业协调成本就很高,所以在政府这件事情上,其实真的是触到了企业的痛点。它不做的时候,大家好像觉得政府不需要做,但是政府一旦做了,你就会觉得,这真是天然应该政府出来做的事儿,因为只有它有这个协调能力。米鹏民:现在我们在人工智能产业方向上,以龙岗这个区域为例,在这个区域里面的企业,它主要瞄着哪些方向去做人工智能的开发?比如说在哪些应用场景做哪些事情?丁宁:智能化的前一个阶段,可以说是自动化,那么在一些公共服务的场景也有这种自动化。比如像做咖啡的机器人,它把人调咖啡的这个动作每个细节都给复刻出来,这是模拟的过程。真正有智能化的调咖啡的机器人,它应该具备哪种能力?调咖啡机器人,它动作模仿人模仿得挺到位的,它在拿一个壶往杯子里面倒咖啡的时候,最后有个小动作——抖一下,觉得这个动作很传神,但实际上这个小动作是人教给它的。它完成这个倒的动作之后,一定要抖一下,为什么?里面的液体还没倒干净。如果这个小动作是由这个机器人自主琢磨出来的,这就有智能化的东西在里面了,它能够应对这种学习没有教过它的一些现象,然后用合理的策略去解决它,这是第一个。第二个,如果说人工智能水平再提升一点,同样是一套双臂,今天可以调咖啡,明天可以做奶茶,后天可以煎个鸡蛋。再到家庭环境,它还可以叠个毛巾,然后做些家务,到工业产线上还能打螺丝,你会发现它实现了通用性。它的这种一套方法、一套算法、一套智能的能力,能够覆盖多个场景多个任务的时候,它的价值一下子就爆发了。这就是所谓的自动化时代和智能化时代一个最重要的区别,它具有跨行业的通用性。那再回头来说,它的这个能力从何而来?就从这个场景里的数据而来。它在场景里面待过,它通过自己的交互过程采集到数据,那么自己总结出来背后的规律,场景越多越丰富,它能总结规律的共性就越完整,这个时候它的适应能力就能够提高。像ChatGPT也是一种通用能力的表现,它是回答全世界80亿人,你不管是什么背景,不管想问什么问题,它都能跟你回答,那它的这个能力从哪来?是把全人类的文本和数据和人类对这个世界的理解全部作为素材,这时候它不是针对特定场景,它是拉通了。米鹏民:这个东西到底在哪些方向有可能突破?从咱们研究院的角度,怎么样能够帮助政府?提一些什么样的建议?丁宁:其实对科研机构来讲,相比高校,它会往实际应用更往前再走一步。所谓的应用研究,其实就是去做试错,做场景的理解和对这种优先程度的判断。智能时代还有很多技术工作没有做,这个时候,过于冒进的还是有问题。政府在开放场景的时候,侧重和选择性比较重要,侧重点应该放在什么地方,资源应该投在什么地方可能会好一点。我们认为现在这一轮的科技范式,它最终的变化还是科技的重工业化,它要重资源、重人才、重数据、重场景,它是整合在一起的。因为这种能力,它是从全行业的数据为基础,它形成的这种智能是要能够理解物理世界的运转规则,理解片面的还不够,理解得越多越好。那这个时候,它的组织能力,整个产业的组织过程,其实要求是比较高的。我相信在政府的科学指导下,包括主动积极的开放场景的人员,能够把这个行业引向更加健康的良性的步骤上来。